草庐IT

python - argparse 参数的可选值

全部标签

html - xslt 允许在 concat 和 normalize-space 中使用参数

我正在查看一些代码,我看到了这个:我只是想知道这个信息,我可以肯定地说$list是一个string并且normalize-space($list)肯定会返回给我一个string和行concat(normalize-space($list),'')肯定会返回一个string(最后一个该字符串的字符是空格?) 最佳答案 $list可以是字符串、数字、节点集,任何东西。结果将是一个字符串。是的,最后一个字符将是一个空格。例如:stringotherstring返回18stringotherstring

python - 如何使用任何 xml 库替换节点的全部内容?

我正在尝试使用Python解析xml文件,但我有一些标签可能包含xml数据。例如:我想这样写CDATA标签:]]>我试过(使用lxml):a=etree.fromstring(data)foreina.findall("code"):e.text=etree.CDATA(etree.tostring(e))但是我得到:]]> 最佳答案 您的替换代码找到了元素并将其序列化为元素的新文本​​。您似乎只想包含的子元素,虽然。尝试设置e.text至CDATA(e.text)而不是序列化e的结果.

xml - 用于定义(输入参数)命令行工具的任何通用(xml?)格式?

是否有用于定义命令行工具(例如输入参数和输出)的通用(xml或类似)格式?格式必须足够详细,以作为自动生成向导来填写工具所需输入的基础。我已经找到了xml-basedformat由生物信息学集成工作台Galaxy创建。问题是Galaxytoolconfig格式的xml文件不是独立的,而是需要一个附带的python(.py)文件来执行一些逻辑,并且不遵循任何定义的格式,因此很难移植到其他语言。所以,寻找其他建议! 最佳答案 docbooks集合包括command-linetools的XML定义.很高兴对您有所帮助。这是一个有趣的问题。

xml - XML/XSLT substring-before 能否将多个匹配字符串作为第二个参数?

XML/XSLT新手问题。我为此道歉。我收到了一大块代码,并被要求“看看这个”,但我对XSLT不是特别熟悉:(我有一个.xsl文件,它可以转换一大块故事文本,并使用以下行提取第一句话:大部分情况下,它工作正常。问题是这样的:如果第一个句子以问号或感叹号结尾,我将以两个句子结尾。是否有任何方法可以按照以下方式做某事:或者有没有一种使用正则表达式的方法,例如/^(.*?)[.?!]\s/...只提取第一句话?或者我是否完全偏离了目标,最好等待常驻XSLT专家回来?:) 最佳答案 如果您的标点符号字符集相对有限,您可以使用翻译功能将其全部

python - 如何输出 XML 实体引用

我正在使用Pythonxml.etree.ElementTree输出XML。我想用实体引用输出它,这些实体引用将在解析XML时被替换。通常'&'被转义为&因为'&'用于声明实体引用。但是,我真的想写一个实体引用。例如,我想编写一个包含实体引用&manifestName;的XML文件:>>>fromxml.etree.ElementTreeimportElement,tostring>>>manifest=Element('manifest')>>>manifest.text='&manifestName;'>>>tostring(manifest)返回一个转义的符号:'&man

php - 可选的正则表达式模式不产生任何值

我在为我的一个项目所做的一些正则表达式方面遇到了一些问题(请记住,我是正则表达式的初学者,这在以下示例中显示)。我在尝试使用关联模式从中提取某些部分的xml代码时遇到了一些问题。我使用以下正则表达式通过preg_match_all获取piclink、urlactive、urltarget、urllink和timevar:/piclink=\"(?.+)\".+urltarget=\"(?.+)\".+urllink=\"(?.*)\".+timevar=\"(?.*)\"/iU到目前为止,一切正常,但是,我现在正尝试通过关联捕获名称和alt标签,这些标签是可选的,因为它们并不总是出现。

python - 使用 lxml 有效地计算非常大的 XML 文档中的元素

我有一个非常大(1.8GB)的XML文档。我想简单地找到带有标签的元素数量.我已经做到了:context=etree.iterparse('./test.xml',tag='Product')num_elems=0forevent,elemincontext:num_elems+=1printnum_elems它有效,但是有没有更快的方法呢? 最佳答案 因为这有效,我认为内存使用不是问题(iterparse将在内存中构建整个文件的树,除非您在迭代时修剪它要素)。在那种情况下,省去在Python中迭代和计数的麻烦,让LXML/libx

python - 当输入开始标记时,lxml 的解析器目标不会立即触发 'start' 回调

我试图使用lxml的parsertargetinterface逐步将XML解析为“自定义”树,我遇到了以下问题:如果您实例化解析器并立即将根元素的开始标记提供给它,则目标的“开始”回调不会触发,直到任何其他事件发生(例如传入数据、结束标记、另一个开始标记等)。这似乎不会发生在任何其他(嵌套)元素上。演示:classEchoTarget(object):defstart(self,tag,attrib):print("start%s%s"%(tag,attrib))defend(self,tag):print("end%s"%tag)defdata(self,data):print("d

使用正则表达式的 Python XML 重建

我有这个部分XMLstring='''someValuesomeValue'''现在我想“傻傻地”修复一下。我想到了一种方法-对所有开始元素和结束元素进行正则表达式-->检查缺少哪个元素并添加它。当然,不要涉及太多细节。到目前为止我得到的是(这不起作用):importrestarts=re.compile('(?)|(?)')print(start.findall(string))我期望的是x:root、x:tag2、x:tag3的列表我一直在谷歌上搜索并尝试了很多,但找不到答案。我从这个表达式中得到的唯一东西是x:root、x:tag1、x:tag3。请帮忙谢谢

python - 从 MediaWiki 的 API 维基文本中提取 Python 中的模板参数

有没有办法从MediaWikia的API中提取部分文本?例如,此链接将所有内容转储为XML格式:http://marvel.wikia.com/api.php?action=query&prop=revisions&titles=All-New%20X-Men%20Vol%201%201&rvprop=content&format=xml但是它没有太多的结构,即使是json格式。我想获取Writer1_1、Penciler1_1等的文本。也许我的参数不正确,所以也许还有其他选择输出。您可以以更易读的方式查看内容here. 最佳答案